import pandas as pd  
  
# 定义文件名列表  
file_names = ['高校门禁分时段门禁出入校趋势.xlsx', '高校门禁各个门进出人次.xlsx', '高校门禁近七日出入校人数.xlsx', '高校门禁近七日访客数.xlsx']  
  
# 创建一个空的DataFrame用于存储所有数据  
all_data = pd.DataFrame()  
  
for file in file_names:  
    # 读取Excel文件  
    df = pd.read_excel(file)  
      
    # 根据文件名和列名，将特定的列添加到all_data DataFrame中  
    if '门禁出入校趋势' in file:  
        all_data = all_data.append(df[['时间', '人次']], ignore_index=True)  
    elif '各个门进出人次' in file:  
        all_data = all_data.append(df[['校门', '次数']], ignore_index=True)  
    elif '出入校人数' in file:  
        all_data = all_data.append(df[['日期', '人数']], ignore_index=True)  
    elif '访客数' in file:  
        all_data = all_data.append(df[['日期', '访客']], ignore_index=True)  
  
# 进行数据清洗，例如，删除重复的行  
all_data = all_data.drop_duplicates()  
  
# 保存清洗后的数据到新的Excel文件  
all_data.to_excel('cleaned_data.xlsx', index=False)  
  
# 读取新生成的表格  
cleaned_data = pd.read_excel('cleaned_data.xlsx')  
  
# 显示表格内容  
print(cleaned_data)
